查看原文
其他

薛贵荣:人工智能 —— 从Narrow到General

2017-06-08 本刊编辑部 数字营销杂志



人工智能是近期的热门

为什么此次人工智能的浪潮会如此汹涌?

和我们又有什么样的关系?



我会从三大方面来做介绍,首先,我们来看看人工智能的应用场景,这里主要包括四个热门的应用场景:



第一场景:购物网站的用户体验优化

今天我们会碰到许多购物网站的用户体验优化问题,需要用人工智能的算法来解决。比如一个典型的购物网站,网站里面有很多的频道,如类目、搜索、营销、头条、热卖、猜你喜欢等,因为频道很多,网站需要把每一个频道的优化问题解决好。但这里每一个频道都需要大量的数据分析,包括算法的优化以及用户的浏览体验等。要解决好这么多的问题,今天最常见的做法就是让很多算法工程师来优化。


第二场景:大数据营销


营销是人工智能今天比较典型的应用场景,但也同样会碰到很多问题:如何知道消费者是否看到了这个广告?他们是否真正喜欢这个广告提到的品牌或商品?这些问题其实也是一个非常难解决的问题。一般来讲营销平台会有一个DMP系统给消费者打上正确的标签,然后做人群定向,之后再做Matching和Ranking,最后进行算法优化。但上千万的广告主需求多样化,也很难满足每一家的精准投放需求。


第三场景:无人驾驶


无人驾驶涉及到非常多的东西,要对道路、行人、车做出识别,对交通标识与障碍物做出决策。众多场景,需求多样。


第四场景:围棋


围棋拥有大量的模式与规则,需要多个围棋专家与工程师的支持。在AlphaGo之前,基本上是通过MCTS+规则来做围棋,围棋也做了几十年的时间,请了大量的专家,但做下来的效果等同于现在业余一段、两段的水平,真的要到高段位的,非常有挑战。



今天有大量的学习任务,大量的参数调优,大量的数据标定需求以及大量的不可定义的因素影响,以至于这么多的事情让我们的算法和机器学习工程师变成调参工程师了。因此,我们思考下一步的人工智能会往哪里走。今天我们觉得通用人工智能(AGI)可能是一个未来解决这个问题的方向,也是我要介绍的第二个内容:通用人工智能。


通用人工智能为什么最近能火起来?也是因为有了AlphaGo的原因,AlphaGo打败李世石以后,其团队提出了叫通用目的的学习机器人,所谓的通用在哪里?包括两个方面,一方面是学习的过程更加自然,而不需要大量的工程师预先编程;另一方面叫通用,通用的意思是它能够被应用在多个项目上,能够用同样的一套学习框架来做多个问题的学习。


整个学习框架是这样的:给定一个目标, AI系统发出一个指令到环境当中,然后环境会给一个反馈到系统,整个过程当中机器自动进行学习,最后再给出一些预判。大家不要觉得这件事情是不可能的,其实这样的事情现在在很多地方已经慢慢的发生了。


通用人工智能整个输入是什么?是我们观测到的像素级的图片、语音、数据流等,目标是希望它能够做更好的学习,同时这个系统也是一个不断迭代优化的过程。通用人工智能的框架体系核心是深度加强化学习,简称DQN系统,这个系统我们会用在很多场景当中,可以用在营销、游戏当中,也可以用在围棋、电力流量、网络流量的优化、量化投资,还可以用在机器人、机械臂、飞行器、无人驾驶等领域。


我们在几个场景中进行了测试,具体如下:


    第一,营销场景。我们做的一个产品叫天钻,采用Explore和Exploit的学习策略。客户试验中CTR、CPM等都超出预期,ROI能够做到数倍以上,拉新等都有非常好的表现。


    第二,游戏场景。在游戏当中,像左边和右边的这两个游戏,一个叫Flappy Bird,一个叫Atari,这个游戏计算机怎么去学习呢?我们会让它像人一样与计算机交互,然后学习如何玩好这个游戏。


    这个游戏不是我们通过写程序让小鸟看到这个柱子就躲一躲,他以图象作为输入,然后机器自动学习,这个大概学了不到一天的时间,小鸟就可以自己去飞了,与人操作完全一样的做法。人类目前最高大概是打999分左右,机器通过学习一天多的时间就超过人了,可以达到几千分甚至几万分。


    第三,围棋场景。刚才讲到围棋,我们大概收集了五段以上20多万的棋盘,以它们为初始数据,来确立围棋的系统,但是只有这点数据还不够,我们会让这个系统自我博弈,大概打了三千万盘。在整个过程当中我们没有用到很专业的围棋知识,只是用了深度学习加上强化学习。



接下来讲讲通用人工智能如何进一步优化?通用人工智能学习优化的方法有哪些呢?


具体如下:


通过反馈来优化


比如Atari、营销、机械臂等。如图所示,我们看到机械臂花了3000多个小时来练习之后,终于看到了“智能反应行为的迹象”,可以抓取任意形状的物体,之前都是没有办法做到的。第二个实验是无人机花了40小时经历了上万次碰撞事故,终于借助AI学会了自动飞行。


自博弈优化


就像刚才讲的围棋一样,围棋是几十万盘的数据,但是要通过上千万盘的自我博弈才能获得有价值的数据,通过自我博弈超过人类高手。



迁移学习优化


毕竟我们今天让人类来标定单个行业的数据是有限的,我们可以借助其它场景的数据来帮助小数据量的系统更好的学习。比如在模拟环境的数据迁移到真实场景中去。福特公司使用虚拟环境,将能迅速提升学习速度,以前需要10天的任务,现在只需20分钟。


对抗式学习优化


这个是目前的研究热点。就是让一个系统有一个教练,还有一个学习者,教练每天指导这个学习的人,哪个地方学得好,哪个地方学得不好,学习者就每天提高,同时也帮助教练提升判断标准。


昨天,水电煤已经成为基础设施被我们人类所使用。今天,云计算也慢慢被我们接受成为计算的基础设施。未来,人工智能会像我们的水电气和云计算一样成为新的基础设施,我们只要接入一根网线就可以用这样的基础设施。


附:第十一届虎啸国际高峰论坛薛贵荣现场采访视频 



https://v.qq.com/txp/iframe/player.html?vid=t0510btgzbb&width=500&height=375&auto=0

在第十一届虎啸国际高峰论坛现场,薛贵荣先生在接受本刊记者采访时谈到:“‘当我们谈及大数据,在现今,我们在营销上已然具备相应的条件了,营销已经走在很多行业的最前端。未来,不论是线上、线下,亦或是线上与线下的融合,对于在营销和零售方面,更加需要企业拥有相关的驱动能力。”


文 / 本文整理自薛贵荣

第十一届虎啸国际高峰论坛上的发言



MORE | 更多精彩




本文刊载于《数字营销》杂志2017年7期

原创稿件,转载请注明出处


关注新浪微博“数字营销杂志”

进入“微博橱窗”,即可购买

6期主题:“汽车营销启示录”


价格:25元/本


小编提示

购买方式一:通过桌面微信,点击本文“阅读原文”,进入“微博橱窗”,进行购买。

购买方式二:打开微博网页/客户端,搜索“数字营销杂志”官方微博,进入“微博橱窗”进行购买。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存